Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages).
Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation...
Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Résultats
Calculs de similarité textuelle entre les pages :
- http://www.mybb.fr/showthread.php?tid=41&pid%3D181
- http://www.mybb.fr/archive/index.php/thread-41.html
Scores de similarité :
- Dice : 31.55%
- Jacard : 18.73%
Dice et Jacard sont deux méthodes de calcul de similarité textuelle, le résultat étant donné sous forme de pourcentage.
D'autres méthodes sont en cours d'analyse. N'hésitez pas à proposer une autre méthode ou à faire vos commentaires dans le forum dans la discussion "[outil] Calcul de similarité textuelle entre 2 pages web".
Nouveau calcul de similarité
Rappel : les outils d'optimisation du contenu
Voici les outils utilisés pour travailler les critères on page du référencement :
- Google Suggest Tool
- Combinaison de mots-clés
- Analyse de similarité textuelle
- Calcul d'indice de densité
- Calcul d'indice de co-ocurrence
Rappel : les principaux outils
Voici les outils les plus souvent utilisés pour travailler son référencement :